A generalization of Otsu method for linear separation of two unbalanced classes in document image binarization
نویسندگان
چکیده
The classical Otsu method is a common tool in document image binarization. Often, two classes, text and background, are imbalanced, which means that the assumption of not met. In this work, we considered imbalanced pixel classes background text: weights different, but variances same. We experimentally demonstrated employment criterion takes into account imbalance classes' weights, allows attaining higher binarization accuracy. described generalization criteria for two-parametric model, an algorithm optimal linear separation search via fast clustering was proposed. also model with proposed increasing accuracy documents complex or spots.
منابع مشابه
Image binarization. The Otsu method
In computer vision and image processing, Otsu's method is used to automatically perform histogram shape-based image thresholding, or, the reduction of a graylevel image to a binary image. The algorithm assumes that the image to be thresholded contains two classes of pixels (e.g. for eground and background) then calculates the optimum threshold separating those two classes so that their combined...
متن کاملAdOtsu: An adaptive and parameterless generalization of Otsu's method for document image binarization
Adaptive binarization methods play a central role in document image processing. In this work, an adaptive and parameterless generalization of Otsu’s method is presented. The adaptiveness is obtained by combining grid-based modeling and the estimated background map. The parameterless behavior is achieved by automatically estimating the document parameters, such as the average stroke width and th...
متن کاملa generalization of strong causality
در این رساله t_n - علیت قوی تعریف می شود. این رده ها در جدول علیت فضا- زمان بین علیت پایدار و علیت قوی قرار دارند. یک قضیه برای رده بندی آنها ثابت می شود و t_n- علیت قوی با رده های علی کارتر مقایسه می شود. همچنین ثابت می شود که علیت فشرده پایدار از t_n - علیت قوی نتیجه می شود. بعلاوه به بررسی رابطه نظریه دامنه ها با نسبیت عام می پردازیم و ثابت می کنیم که نوع خاصی از فضا- زمان های علی پایدار, ب...
Binarization of Document Image
Documents Image Binarization is performed in the preprocessing stage for document analysis and it aims to segment the foreground text from the document background. A fast and accurate document image binarization technique is important for the ensuing document image processing tasks such as optical character recognition (OCR). Though document image binarization has been studied for many years, t...
متن کاملfocus on communication in iranian high school language classes: a study of the role of teaching materials in changing the focus onto communication in language classes
چکیده ارتباط در کلاس به عوامل زیادی از جمله معلمان، دانش آموزان، برنامه های درسی و از همه مهم تر، مواد آموزشی وابسته است. در تدریس ارتباطی زبان که تاکید زیادی بر توانش ارتباطی دارد، کتاب درسی به عنوان عامل موثر بر پویایی کلاس محسوب میگردد که درس ها را از طریق فراهم آوردن متن ارتباط کلاسی و هم چنین نوع تمرین زبانی که دانش آموزان در طول فعالیت های کلاسی به آن مشغول اند، کنترل می کند. این حقیقت ک...
15 صفحه اولذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Computer Optics
سال: 2021
ISSN: ['2412-6179', '0134-2452']
DOI: https://doi.org/10.18287/2412-6179-co-752